ارائه رهیافتی جدید برای تولید پیکره موازی انگلیسی-فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی
- نویسنده سید احمد جکیان طوسی
- استاد راهنما محسن کاهانی هادی صدوقی یزدی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
در این پژوهش، برای اولین بار مدلی ترکیبی برای تراز بندی جملات، جهت ساخت پیکره های موازی انگلیسی-فارسی ارائه شده است. در حالت کلی چارچوب روش پیشنهادی، غیر وابسته به زبان های مبدأ و مقصد بوده و از آن می توان برای تولید پیکره های موازی، برای هر جفت زبان دیگر، نیز استفاده کرد. نتایج بدست آمده از پیاده سازی ها نشان می دهد که بکار بردن ویژگی های زبانی و غیر زبانی ، عملکرد سیستم را تا حد قابل قبولی بهبود خواهد بخشید. همچنین در این تحقیق میزان تأثیر استفاده از شباهت های طولی، ترجمه تحت اللفظی و نقش دستوری کلمات، به صورت مستقل یا ترکیبی، برای عملیات ترازبندی مورد بررسی قرار گرفته است. بکارگیری طبقه بندهای سلسله مراتبی در تشخیص نوع تراز بندی به عنوان یکی از شاخص های اصلی سیستم پیشنهادی محسوب می شود که موجب بالا رفتن دقت وسرعت عملیات تولید پیکره نسبت به سایر مدل ها می شود. از ویژگی های دیگر این روش، قابلیت توسعه پذیری آن است. به این ترتیب که می توان با گنجاندن خصوصیاتی (در بدنه بردارهای ورودی) که ممکن است در آینده برای تشخیص بهتر نوع تراز بندی مورد توجه قرار گیرند کیفیت سیستم ترازبندی را ارتقاء بخشید. با این حال، چالش اساسی این رهیافت و بسیاری از روش های پیشین، وجود سلایق متنوع در ترجمه متون است. این مسئله در برخی موارد موجب تولید جملاتی می گردد که مشابهت آن ها با متن اصلی در حد معنا بوده و تنها قابل درک و تشخیص برای انسان می باشد. در چنین وضعیتی کار استخراج جفت عبارات معادل، بسیار دشوار است. علاوه براین در مورد متونی که مقید به رعایت ساختار دستوری زبان فارسی و انگلیسی نمی باشند عملیات تشخیص جملات هم تراز ممکن است به خوبی انجام نپذیرد.
منابع مشابه
پیکره اعلام: یک پیکره استاندارد واحدهای اسمی برای زبان فارسی
Named entity recognition (NER) is a natural language processing (NLP) problem that is mainly used for text summarization, data mining, data retrieval, question and answering, machine translation, and document classification systems. A NER system is tasked with determining the border of each named entity, recognizing its type and classifying it into predefined categories. The categories of named...
متن کاملارائه های علمی انگلیسی و فارسی: بررسی چگونگی تفکیک مطالب مهم از کماهمیت در پیکره های سخن و بیس
هدف از انجام این پژوهشِ پیکرهمحور، بررسی چگونگی جداسازی مطلب های بااهمیت از کماهمیت در ارائه های علمی انگلیسی و فارسی است. مقاله حاضر کوشیدهاست تا نشانگرهای مطالبِ بااهمیت را از نظر نقشی که در ارائه دارند، دستهبندی نماید. به این منظور، از روش تحقیق ترکیبی بهره گرفته شدهاست. به منظور یافتن نشانگرهای مطلبهای بااهمیت، 160 ارائه در پیکره بیس و 60 ارائه در پیکره فارسی سخن، موردبررسی قرار گرفت...
متن کاملپیکره متنی تطبیقی فارسی-انگلیسی حوزه تخصصی فاوا
در زبان شناسی، پیکره انبارهای از داده های متنی است. در این مقاله، تمرکز ما بر طراحی و ساخت خودکار پیکره دو زبانه فارسی-انگلیسی است. ما نرم افزاری برای ساخت پیکره طراحی کرده ایم که هزینه و زمان ساخت پیکره را کاهش می دهد؛ به علاوه نرمافزار ارائه شده قابلیت مدیریت پیکره را نیز برای کاربران فراهم می کند. در این مقاله، روشی برای ترازبندی جمله های پیکره فارسی تخصصی حوزه فاوا و جملات انگلیسی پ...
متن کاملساخت پیکره ی دوزبانه موازی انگلیسی- فارسی و کاربرد آن در سامانه حافظه ترجمه (مبحثی در زبانشناسی پیکره ای)
در حال حاضر برونداد سامانه های ترجمه ماشینی نیاز به پس ویرایش دارد. در ترجمه ماشینی خودکار امکان دخالت کاربر حین کار وجود ندارد و مترجم پس از بروز خطا به رفع آن می پردازد. ابزارهای ترجمه می توانند با ایجاد محیطی تعاملی رفع خطاها را قبل از انتقال به برونداد ممکن سازند. مهمترینِ این ابزارها, سامانه های حافظه ترجمه هستند که از متون موازی همترازشده استفاده می کنند. فنون همترازسازی خودکار مورد استفاد...
15 صفحه اولارائه یک الگوریتم جدید برای پارک موازی خودرو مبتنی بر طراحی مسیر با انحنای پیوسته کلوتوئید
یکی از دستاوردهای صنعت خودرو در سالهای اخیر اضافه نمودن سیستم انجام پارک خودوند خودرو میباشد که این سیستم میتواند بدون دخالت یا با راهنمایی انسان خودرو را در محل مورد نظر پارک نماید. در این مقاله با ارایه یک الگوریتم جدید سعی شده تا با استفاده از خواص منحنی کلوتوئید، مسیر قابل پیمایشی برای حرکت خودرو به سمت جایگاه پارک طراحی شود. حرکت خودرو در این مسیرِ هموار به صورت پیوسته، با سرعت ثابت و ای...
متن کاملساخت پیکره تطبیقی فارسی-انگلیسی و استخراج جملات موازی از آن
کیفیت بسیاری از کاربردهای پردازش زبان های طبیعی مانند سیستم های ترجمه ی ماشینی به پیکره های موازی که برای آموزش آنها استفاده می شود، بسیار وابسته است. بنابراین یکی از نیازهایی که در این حوزه وجود دارد، تهیه ی پیکره های موازی با حجم داده ای بالا و محتوای متنوع می باشد. مشکلی که در استفاده از پیکره های موازی وجود دارد، حجم اندک اطلاعات موازی موجود بر روی منابع اطلاعاتی است. در سال های اخیر، تلا...
15 صفحه اولمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023